home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 000801_timbl _Thu Apr 1 01:45:54 1993.msg < prev    next >
Internet Message Format  |  1994-01-24  |  2KB

  1. Return-Path: <timbl>
  2. Received: by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA22389; Thu, 1 Apr 93 01:45:54 MET DST
  4. Date: Thu, 1 Apr 93 01:45:54 MET DST
  5. From: timbl (Tim Berners-Lee)
  6. Message-Id: <9303312345.AA22389@ nxoc01.cern.ch >
  7. To: janssen@parc.xerox.com, www-talk@nxoc01.cern.ch
  8. Subject: Re: Filters for HTML?
  9. Cc: secret@dxcern.cern.ch
  10.  
  11. Yes, we have very crude filters for converting clean SGML to TeX
  12. -- just 'sed' files.   They will take the output of the NextStep
  13. WorldWideWeb.app becaus it puts line breaks in and so sed
  14. can handle it.
  15.  
  16. If you want to make a converter which parses the HTML properly,
  17. you could take the line mode client version 2.0, and
  18. in the library just hack the HTML regeneration module
  19. HTMLGen.{c,h} to produce TeX instead of HTML. The module
  20. is driven by a stream of text and element stop/start by
  21. element number, so it is just a set of tables of strings.
  22.  
  23. If you are interested in our mapping, ask Arthur Secret
  24. <secret@dxcern.cern.ch> to mail you our latest sed files.
  25. We in fact made one new latex macro  for the paper docs
  26. we push out, in order to do a better job of DL lists.
  27.  
  28. The basic sed files for making article style latex are
  29. on the web ... look under "tools for information providers".
  30.  
  31. Tim
  32.     From janssen@parc.xerox.com Thu Apr  1 00:56:53 1993
  33.     Return-Path: <janssen@parc.xerox.com>
  34.     Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  35.         id AA21635; Thu, 1 Apr 93 00:56:39 MET DST
  36.     Received: from alpha.Xerox.COM by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  37.         id AA21261; Thu, 1 Apr 1993 01:15:29 +0200
  38.     Received: from holmes.parc.xerox.com ([13.1.100.162]) by alpha.xerox.com with SMTP id <11942>; Wed, 31 Mar 1993 15:15:08 PST
  39.     Received: by holmes.parc.xerox.com id <16134>; Wed, 31 Mar 1993 15:15:00 -0800
  40.     Received: from Messages.7.15.N.CUILIB.3.45.SNAP.NOT.LINKED.holmes.parc.xerox.com.sun4.41
  41.               via MS.5.6.holmes.parc.xerox.com.sun4_41;
  42.               Wed, 31 Mar 1993 15:14:54 -0800 (PST)
  43.     Message-Id: <ofiWLioB0KGWFC3=Zz@holmes.parc.xerox.com>
  44.     Date:     Wed, 31 Mar 1993 15:14:54 PST
  45.     Sender: Bill Janssen <janssen@parc.xerox.com>
  46.     From: Bill Janssen <janssen@parc.xerox.com>
  47.     To: www-talk@nxoc01.cern.ch
  48.     Subject: Filters for HTML?
  49.     In-Reply-To: 
  50.     References: 
  51.     Status: O
  52.  
  53.     Does anyone have filters that will convert HTML to TeX?  Or TROFF?  Or
  54.     PostScript?  or anything...
  55.  
  56.     Bill
  57.